home *** CD-ROM | disk | FTP | other *** search
/ EnigmA Amiga Run 1996 February / EnigmA AMIGA RUN 04 (1996)(G.R. Edizioni)(IT)[!][issue 1996-02][Skylink CD III].iso / earcd / fonts / altfntpc.lha / AltFontPatch / kódování E2 < prev    next >
Text File  |  1995-10-20  |  8KB  |  150 lines

  1.     kódování.doc
  2.  
  3. Dokumentace k:    AltFontPatch - volba kódování
  4.         $VER: kódování_doc 2.76 (20.10.95)
  5.  
  6. Autor:        Stanislav Brabec (UTX)
  7.         Vyîehradská 27
  8.      128 00 PRAHA 2 - Nové Mësto
  9.         Çeská republika
  10.        telefon: +42 2 291397
  11.     e-mail:    utx@k332.feld.cvut.cz
  12.  
  13.     Informace o souboru
  14.     Tento  text  se podrobnëji zabývá volbou kódování znakových sad pro
  15. poçítaçe AMIGA a zdûvodñuje vznik kódování ªE2º.
  16.  
  17.     Oprávnëní
  18.     Tento soubor je veêejnë îiêitelný. Kódování souboru: ªE2º.
  19.  
  20.     Úvod
  21.     Pêi pêípravë çeského národního prostêedí vznikla potêeba rozhodnout
  22. o  kódování  çeských  znakû  u poçítacû AMIGA.  V té dobë kolovalo na AMIGU
  23. vëtîí  mnoùství  rûzných  kódování,  které byly více çi ménë (vëtîinou vîak
  24. ménë)  vhodné  a  mëly  rûznou  dalîí  podporu.   Bylo moùné vybrat nëkteré
  25. z nich,  anebo sáhnout po normë.  Udëlal jsem to druhé a implementoval jsem
  26. kódování ISO 8859-2, çili tzv. Latin 2.  Pêi testování jsem vîak narazil na
  27. problémy, a proto vzniklo kódování ªE2º, které je êeîí.
  28.     Struçný pêehled norem a jejich obsahu
  29.     Kdo si pêeçte normu ÇSN 36 9103, opraví si ji dle opravního lístku,
  30. opravy  opravního  lístku,  opravy  opravy  opravního lístku, a dále opraví
  31. chyby,  které  tam  pêes  têi vydané erraty zûstaly, zjistí, jak má vypadat
  32. osmibitové  kódování u poçítaçû v zemích (bývalého) RVHP.  Nalezne zde mimo
  33. jiné následující kódování:
  34.  
  35. KOI-8 K1    s výjimkou 2 znakû ASCII + azbuka
  36. KOI-8 L2    s výjimkou 4 znakû ISO Latin 2
  37. KOI-8 ÇS2    s výjimkou 2 znakû ASCII + çeîtina,  slovenîtina,  základní
  38.         semigrafika, nëkolik êeckých písmen, ©, ®, a ªCHº a ªchº
  39.  
  40. a dále nëkolik podivných kódování, které nedodrùují ani rozloùení ASCII.
  41.     Ony  4 výjimeçné znaky jsou navzájem zamënëné znaky (dle doporuçení
  42. jakési ªIRVº):
  43. $ <-> ¤ (znak ªdollarº je pravdëpodobnë z ideologických dûvodû zamënëný se
  44.     znakem  ªcurrencyº)
  45. ~ <-> ¯ (zámëna ªtildeº a ªmacronº, dûvod zámëny je nejasný)
  46.  
  47.     Dalîí  (nejdûleùitëjîí)  normou,  která  stojí  za  úvahu, je norma
  48. ISO 8859,  zejména  její  çást  ISO 8859-2.   Je  to  ona  známá  ªLatinská
  49. abeceda 2º.
  50.     Zdá  se,  ùe  právë tuto normu chtëla firma Commodore implementovat
  51. pro Amigu.  Nároçný uùivatel vîak chce, aby mohl pouùívat çeské uvozovky, a
  52. aby  zûstaly  nezkomolené  znaky,  které  operaçní systém pouùívá.  I na to
  53. norma   ISO   pamatuje  a  definuje  tzv. kódové  strany.   A  tuto  úroveñ
  54. implementace  Amiga  nemá!   Implementaci  kódových  stran  má zçásti pouze
  55. ¸locale.library¢  a  ¸bullet.library¢.   Jádro  operaçního systému vîak nic
  56. takového  ani  ve  verzi  3.0  neobsahuje.  A tak do doby, neù se objeví na
  57. Amize 16-bitové sluùby, nezbývá, neù vyrobit privátní kódovou stranu, která
  58. vîechny potêebné znaky obsahuje.  Takovou je právë kódová strana ¸E2¢.
  59.     V této  kapitole  poznamenám  jeîtë dalîí dûleùitý poznatek pro ty,
  60. kteêí  by  chtëli  implementovat  azbuku:   Pouùití kódové strany ªCyrilské
  61. kódování 1º  by  bylo  dle  normy  ùádoucí,  ale  pêi pojmenovávání souborû
  62. azbukovými  jmény  zpûsobí  jeho  implementace  u diskû v mezinárodním módu
  63. zhroucení  tzv. haîovací  tabulky  diskového systému a tím znaçné zpomalení
  64. práce se soubory.  Proto ani pro azbuku není u AMIGY vhodná norma ISO!
  65.  
  66.     Zdûvodnëní kódování ªE2º
  67.     Pêi návrhu této kódové strany jsem se êídil tëmito zásadami:
  68.  -  V maximální  moùné  míêe zachovat pûvodní znaky, aby texty byly alespoñ
  69. srozumitelné (pouze znak ªÿº tuto konvenci nedodrùuje, protoùe u znakû ªE2º
  70. je nepárový a na speciální pozici)
  71.  -  Podpoêit çeîtinu, slovenîtinu, polîtinu a zachovat nëmçinu
  72.  -  Implementovat   nejenom   diakritiku,   ale   i  interpunkçní  znaménka
  73. (uvozovky)
  74.  -  Ponechat vëtîinu speciálních znakû
  75.  -  Oblast  znakû $80 - $9F nepouùít, protoùe ji ISO jako systémovou oblast
  76. nepodporuje.
  77.  -  Oblast znakû $A0-$BF,$D7,$DF,$F7,$FF vyuùít pro interpunkci a speciální
  78. znaky (znak $FF jako speciální pozice)
  79.  -  Oblast znakû $C0-$D6,$D8-$DE pouùít pro velká písmena s diakritikou
  80.  -  Oblast znakû $E0-$F6,$F8-$FE pouùít pro malá písmena s diakritikou tak,
  81. aby malé písmeno mëlo poloho o $20 vyîîí neù odpovídající velké
  82.     Dalîím  poùadavkem,  který  byl  na  tuto znakovou sadu poloùen, je
  83. snadné  národní  srovnávání  êetëzcû  (diakritika  nad  urçitým písmenem je
  84. êazena v poêadí podle ÇSN 01 0181 {opët s výjimkou ªÿº}).
  85.     Pouze  dodrùení  tëchto  poùadavkû  umoùní  správnou  funkci  vîech
  86. správnë  napsaných  programû  i  bez  pouùití ¸locale.library¢ pêi takových
  87. funkcích, jakými je rozpoznávání a pêevod malých písmen na velká.
  88.     Tabulka znakû
  89.  
  90.  -------------------------------------------------------------------------
  91. | DEC HEX | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F |
  92. |-------------------------------------------------------------------------|
  93. |  32  20 |   | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
  94. |-------------------------------------------------------------------------|
  95. |  48  30 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
  96. |-------------------------------------------------------------------------|
  97. |  64  40 | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
  98. |-------------------------------------------------------------------------|
  99. |  80  50 | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
  100. |-------------------------------------------------------------------------|
  101. |  96  60 | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
  102. |-------------------------------------------------------------------------|
  103. | 112  70 | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ |  |
  104. |-------------------------------------------------------------------------|
  105. | 160  A0 |   | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | ­ | ® | ¯ |
  106. |-------------------------------------------------------------------------|
  107. | 176  B0 | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
  108. |-------------------------------------------------------------------------|
  109. | 192  C0 | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
  110. |-------------------------------------------------------------------------|
  111. | 208  D0 | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |
  112. |-------------------------------------------------------------------------|
  113. | 224  E0 | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
  114. |-------------------------------------------------------------------------|
  115. | 240  F0 | ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |
  116.  -------------------------------------------------------------------------
  117.  
  118. Poznámka:    Znaky   ¸á¢,  ¸é¢,  ¸í¢,  ¸ó¢,  ¸ú¢,  ¸ý¢  jsou  sice  podobné
  119. odpovídajícím   znakûm  pûvodní  znakové  sady,  ale  nejsou  s nimi  zcela
  120. zamënitelné.   Liîí se od sebe umístëním a tvarem çárky nad písmenem (je to
  121. patrné zvláîï u vëtîích velikostí znakových sad).
  122.     Srovnání výhod a nevýhod ªE2º a ªISO Latin 2º
  123.  
  124.  -----------------------------------------------------------
  125. |                    |    E2      | Latin 2 |
  126. |-----------------------------------------------------------|
  127. | definováno normou            |    -      |    +    |
  128. |-----------------------------------------------------------|
  129. | malá <-> velká písmena bez ¸locale¢    |    +      |    -    |
  130. |-----------------------------------------------------------|
  131. | systémem pouùívané znaky »©·®        |    +      |    -    |
  132. |-----------------------------------------------------------|
  133. | îiroký repertoár uvozovek ªº¥"¸¢¡`'«»    |    +      |    -    |
  134. |-----------------------------------------------------------|
  135. | zachování zlomkû a exponentû        |    +      |    -    |
  136. |-----------------------------------------------------------|
  137. | sekundární têídící poêadí        |    +      |    -    |
  138. |-----------------------------------------------------------|
  139. | implementace pêenositelných médií    |    -      |    +    |
  140. |-----------------------------------------------------------|
  141. | rumunîtina a maðarîtina        |    -      |    +    |
  142.  -----------------------------------------------------------
  143.  
  144.  Vysvëtlivky:
  145. +: snadná implementace, odpovídá poùadavkûm
  146. -: nesnadná implementace, neodpovídá poùadavkûm
  147.  
  148.     Které kódování si uùivatel zvolí, nechávám na nëm.
  149.     Konec souboru.
  150.